打开APP

Nature:AI“造”物主——从一个原子开始,精准设计“生物导弹”,抗体研发迎来新纪元?

来源:生物探索 2025-11-09 11:33

研究人员展示了一种革命性的方法:利用一个经过特殊“调教”的人工智能模型RFdiffusion,完全在计算机中从零开始 设计出全新的、能够以原子级精度结合特定表位的抗体。

在现代医学的武器库中,抗体药物无疑是最耀眼的明星之一。它们如同被精确制导的“生物导弹”(biological missile),能够精准识别并结合我们体内的“敌人”——无论是狡猾的病毒、失控的癌细胞,还是引发炎症的异常蛋白。每年,全球有数以亿计的患者受益于这些巧妙的蛋白质分子,其市场价值已然是一个数千亿美元的庞大版图。

然而,在这片繁荣的背后,一个长期存在的瓶颈始终困扰着药物研发领域:我们如何能随心所欲地制造出能够命中敌人“阿喀琉斯之踵”的导弹?传统上,抗体的发现过程更像是一场大规模的“海选”。研究人员通过免疫动物(如小鼠)或筛选巨大的基因库,希望能“幸运地”找到能够结合目标的抗体。这个过程不仅耗时数月甚至数年,成本高昂,而且充满了不确定性。更关键的是,它是一个“先发现,后验证”的过程,我们往往先得到一个能结合的抗体,再去分析它到底打中了靶点的哪个位置,即表位(epitope)。如果这个位置并非我们期望的关键功能位点,那么之前的所有努力可能都将付诸东流。

我们能否颠覆这个流程,直接“设计”一枚导弹,让它从诞生之初就瞄准我们指定的、最致命的那个表位?

11月5日,《Nature》的研究报道“Atomically accurate de novo design of antibodies with RFdiffusion”,给出了一个响亮的回答。研究人员展示了一种革命性的方法:利用一个经过特殊“调教”的人工智能模型RFdiffusion,完全在计算机中(in silico) 从零开始(de novo) 设计出全新的、能够以原子级精度结合特定表位的抗体。这不仅仅是一次技术的迭代,它可能预示着抗体药物研发范式的根本性转变,从“发现时代”迈向“设计时代”。

图片

“大海捞针”的困境:传统抗体发现的“运气”与“蛮力”

要理解这项新技术的颠覆性,我们先来看看传统方法的局限性。

想象一下,你是一名军事工程师,任务是摧毁一座敌方碉堡。你知道碉堡的弹药库是其最薄弱的环节,但你不知道弹药库的具体位置。传统的抗体发现就像是给你一万枚普通的炮弹,让你对碉堡进行地毯式轰炸。你发射了成千上万发炮弹,最终有几发碰巧击中了弹药库,任务完成。但这个过程浪费了大量资源,而且成功与否很大程度上依赖运气。你无法保证下一次面对新碉堡时,还能有同样的好运。

这就是免疫动物或文库筛选的真实写照。当我们将一个靶点蛋白(抗原)注射到小鼠体内,它的免疫系统会被激活,产生千千万万种不同的抗体。这些抗体有的结合力强,有的弱;有的打中要害,有的则无关痛痒。研究人员需要通过复杂的筛选技术,像淘金一样,从这片抗体的汪洋中,找到那几颗真正有价值的金子。

更先进的噬菌体展示(phage display)或酵母展示(yeast display)技术,虽然将筛选过程搬到了体外,构建了数以十亿计的庞大抗体库,但其本质依然是“筛选”而非“设计”。它提高了找到“命中者”的概率,但并未解决“精准瞄准”的核心问题。我们依然是在一个巨大的、随机的可能性空间里进行搜索,希望找到能与我们感兴趣的靶点结合的分子。

这种模式的弊端显而易见:

表位不可控:对于许多疾病,只有抑制靶点蛋白的特定区域才能起到治疗效果。例如,阻止病毒与宿主细胞受体结合的位点,或是一个蛋白激酶的活性口袋。传统方法很难保证产生的抗体恰好就结合在这些“黄金表位”上。

效率低下:整个流程,从免疫/建库到筛选、验证,是一个漫长而昂贵的旅程。

免疫盲点:有些重要的靶点表位在结构上与宿主自身的蛋白相似,动物的免疫系统会产生耐受,无法产生有效的抗体。这被称为免疫系统的“盲点”。

多年来,无数研究人员梦想着能摆脱这种“靠天吃饭”的模式。如果能像建筑师设计蓝图一样,事先规划好抗体的每一个细节,它的骨架结构、负责结合的区域(互补决定区,Complementarity-Determining Regions, CDRs),以及它与靶点表位的精确作用方式,那将是怎样一番景象?

AI的“创世之力”:当RFdiffusion学会了抗体的语言

研究团队所做的,正是将这个梦想照进现实。他们使用的核心工具,是一种被称为“扩散模型”(diffusion model)的深度学习算法。

你或许对扩散模型有所耳闻,近年来火爆的AI绘画工具(如Midjourney, Stable Diffusion)正是基于此。它的工作原理颇具哲学意味:先学习一个物体(比如一张猫的图片)的特征,然后不断地向这张图片添加随机的“噪声”,直到它变成一片毫无规律的雪花点。这个过程被称为“前向扩散”。接着,AI学习如何从这一片混沌的噪声中,一步步“去噪”,最终恢复出原始的、清晰的猫的图片。这个逆向过程,就是“生成”。

当AI完全掌握了从噪声到有序结构的秘诀后,它就具备了“创造”的能力。你给它一堆完全随机的噪声,它也能“脑补”并生成一张全新的、世界上从未有过的猫的图片。

研究人员巧妙地将这个思想应用到了蛋白质结构设计上。蛋白质本质上是由氨基酸链折叠成的三维结构。他们将蛋白质的结构信息(原子坐标和方向)视为一幅“3D图像”。RFdiffusion模型通过学习数以万计的真实蛋白质结构,掌握了蛋白质折叠的内在“语法规则”。

然而,通用的蛋白质设计模型并不足以胜任抗体设计这一精细任务。因为抗体的功能核心在于其CDR区,这几个高度可变的环状结构像“手指”一样,需要以极其精确的方式“抓住”抗原的特定表位。通用模型或许能设计出结构稳定的蛋白质,却无法保证这种功能性的、精密的相互作用。

为此,研究人员对RFdiffusion进行了专门的“特训”。他们收集了大量已知的抗体-抗原复合物的晶体结构数据,让模型专注于学习抗体是如何与靶点结合的。在训练中,他们给了模型几个关键的“指令”:

1. 固定框架:抗体的绝大部分结构是相对稳定的框架区(framework region),如同导弹的弹体。研究人员将这个框架区的结构作为“条件”输入给模型,让AI在此基础上进行创作,确保生成的是一个“抗体”而不是别的什么蛋白质。

2. 指定表位:研究人员在靶点蛋白上指定了几个关键的氨基酸残基,作为“热点”(hotspot),告诉AI:“你的任务就是设计出能够与这些点紧密互动的CDR区。”

3. 自由创作:在满足以上条件下,模型被赋予了充分的自由度,去生成全新的CDR环的构象,以及整个抗体相对于靶点的最佳结合姿态(即“停靠模式”,docking mode)。

经过这样的精细调校(fine-tuning),RFdiffusion从一个通用的“结构画家”,进化成了一位专业的“抗体设计师”。它学会了抗体世界的语言,理解了CDR与表位之间原子级别的“对话方式”。

从“虚拟”到“现实”:AI设计的“纳米抗体”首次实战

理论的优美,终须经过实验的检验。研究团队选择了几种与人类疾病密切相关的靶点,作为AI设计师的“毕业考题”。它们包括:艰难梭菌毒素B(Clostridium difficile Toxin B, TcdB),这是导致严重肠道感染的关键毒素;流感病毒血凝素(influenza haemagglutinin, HA);呼吸道合胞病毒(RSV)以及新冠病毒(SARS-CoV-2)的受体结合域(RBD)。

他们首先将目光投向了一种结构更简单的抗体,骆驼科动物来源的单域抗体(VHHs),也常被称为“纳米抗体”(nanobody)。相比于传统抗体拥有重链和轻链两条肽链(共六个CDR区),VHH仅由一条重链可变区构成(三个CDR区),设计难度相对较低,是检验模型能力的理想起点。

AI模型不负所望,针对每个靶点都生成了数千个不同的VHH设计方案。研究人员通过计算筛选后,挑选出数百到数千个最优设计,并通过基因合成技术,在酵母细胞表面展示这些AI设计的VHH蛋白,进行高通量的结合能力筛选。

结果令人振奋。这些完全由AI凭空创造的VHH,在现实世界中表现出了真实的结合活性。

针对流感病毒HA,筛选出的亲和力最高的VHH,其解离常数(Kd)达到了78 nM。这是一个相当不错的结合强度,通常认为nM级别的亲和力已具备成药潜力。

针对艰难梭菌毒素TcdB,最佳VHH的亲和力为262 nM。针对SARS-CoV-2 RBD,也找到了一个亲和力为5.5 µM的结合者。

仅仅证明“能结合”还不够,关键在于是否“按预想的方式结合”。研究人员进行了一项巧妙的竞争实验。以TcdB为例,AI设计的VHH的目标表位,是TcdB上一个已知的与人体Frizzled受体结合的区域。研究人员先将一个已知能结合该区域的、非抗体类的小蛋白分子与TcdB结合,当这个“黄金表位”被占据后,他们再加入AI设计的VHH。实验数据显示,此时VHH几乎完全无法结合TcdB。反之亦然。 这有力地证明了,AI设计的VHH确实精准地命中了预设的靶点。 针对RBD的VHH也通过类似的竞争实验,被证实结合在了正确的表位上。

这些数据清晰地表明,RFdiffusion不仅能设计出会结合的分子,更能设计出在指定位置结合的分子。AI的“设计图纸”在现实世界中得到了成功的“施工”。

“眼见为实”的震撼:冷冻电镜下的原子级精确度

如果说结合和竞争实验是令人信服的证据,那么冷冻电子显微镜(Cryo-electron microscopy, Cryo-EM)的结果,则带来了近乎“震撼”的视觉确认。Cryo-EM技术能够以近乎原子的分辨率,直接“看到”蛋白质复合物的三维结构。

研究人员成功解析了AI设计的抗流感病毒VHH(VHH_flu_01)与天然的、带有糖基化修饰的三聚体流感HA蛋白复合物的结构,分辨率高达3.0 Å。当他们将实验解析出的真实结构与AI最初的计算机设计模型进行比对时,奇迹发生了:

两者惊人地吻合!

整个VHH分子的骨架结构,实验值与设计模型的均方根偏差(Root Mean Square Deviation, RMSD)仅为1.45 Å。在蛋白质结构领域,低于2 Å的RMSD通常被认为是高度一致的。

更令人惊叹的是,负责核心结合功能的CDR3环,其RMSD值仅为0.8 Å!这意味着,AI不仅预测对了整体构象,甚至连这个最关键、最灵活区域的每一个原子的空间位置都几乎分毫不差。

设计模型中预测的与HA蛋白发生相互作用的几个关键氨基酸侧链(如V100, V101, S103, F108),在真实的结构中,也确实伸向了同样的位置,与靶点形成了预期的相互作用网络。

这幅3D图像所传递的信息是明确的:RFdiffusion的设计精度,已经达到了原子级别。它不是一个模糊的草图,而是一份可以精确到每一个螺丝钉位置的工业级蓝图。

同样,针对TcdB的VHH复合物的结构解析,虽然分辨率稍低,但也明确证实了VHH的结合位点和结合姿态与设计模型高度一致。这进一步证明了该方法的普适性和可靠性。

挑战升级:AI能否驾驭更复杂的“六手连弹”?

在VHH上取得的巨大成功,鼓舞着研究团队向更宏大的目标迈进:设计标准的、拥有重链和轻链的抗体。这好比一位钢琴家在完美演奏了单手练习曲后,开始挑战需要双手、甚至“六手”(比喻六个CDR区)协同的复杂奏鸣曲。

标准的抗体可变区(scFv或Fab)包含六个CDR环(重链三个,轻链三个),它们必须像六根配合默契的手指,共同抓住抗原。设计的复杂性呈指数级增长。任何一个CDR环的微小失误,都可能导致整个结合功能的丧失。

面对这一挑战,研究人员再次展现了他们的智慧。他们意识到,从头设计一个完美的重-轻链配对非常困难。于是,他们采取了一种“结构引导的组合策略”。

首先,AI针对同一个靶点表位,会生成许多个结构上非常相似、结合模式也几乎一样的设计方案。这些方案可以被归为同一个“结构簇”。理论上,同一个簇里的任何一个重链,都应该能和任何一个轻链很好地“兼容”。

于是,他们不再坚持合成AI设计的固定配对,而是在同一个“结构簇”内,将所有设计的重链和轻链随机组合,构建了一个“智能组合文库”。这种做法极大地增加了找到成功配对的概率,巧妙地绕过了从头设计完美配对的超高难度。

他们将这一策略应用于两个极具挑战性的靶点:一个是前面提到的TcdB的Frizzled结合位点;另一个是临床上极为重要的肿瘤靶点——由PHOX2B蛋白的一个短肽与主要组织相容性复合物(MHC)组成的复合物。后者是开发新型CAR-T疗法治疗神经母细胞瘤的关键。

实验结果再次验证了这一策略的成功。

他们从针对TcdB的智能组合文库中,筛选到了多个亲和力达到nM级别的scFv分子。其中最优秀的scFv6,亲和力高达72 nM。

更重要的是,对scFv6与TcdB复合物的Cryo-EM结构解析,再次上演了原子级精确度的“神话”。分辨率3.6 Å的结构显示,这个由两条链、六个CDR组成的复杂分子,其真实的结合模式与AI的设计蓝图(由两个不同的亲本设计拼接而成)完美贴合,整体RMSD仅为0.9 Å。

六个CDR环的骨架,每一个都达到了惊人的准确度,RMSD值在0.2 Å到1.1 Å之间。这表明,RFdiffusion已经具备了同时精确设计多个相互作用环的能力。这是抗体设计领域前所未有的成就。

至此,研究人员已经证明,他们的AI设计平台,无论是面对简单的VHH,还是复杂的scFv,都能够实现从零开始、针对特定表位的、原子级精度的设计。

诚实的“短板”与聪明的“外挂”:从“能用”到“好用”的进化之路

任何一项突破性的技术在诞生之初,都不可能完美无瑕。该研究最可贵的地方之一,在于它不仅展示了惊人的成功,也坦诚地指出了当前的局限,并提出了巧妙的解决方案。

短板一:初始亲和力有待提高。 尽管AI设计的抗体能精准结合,但部分设计的初始亲和力还不够高(例如,一些设计在µM级别),离临床应用的要求还有距离。

对此,研究人员引入了一个强大的“外挂”工具,OrthoRep系统。这是一个巧妙的基因定向进化系统。他们将AI设计的VHH基因置于这个系统中,该系统使用一种“粗心”的DNA聚合酶,在酵母细胞内持续地、高速地引入随机突变,并结合酵母展示技术,不断筛选出亲和力更高的后代。

结果非常理想。经过OrthoRep的“催熟”,AI设计的VHH的亲和力普遍提升了约两个数量级(100倍),轻松进入了高亲和力的单、双位数nM范围,完全满足了后续成药开发的需求。更重要的是,后续的结构分析证实,这种亲和力的成熟过程,并未改变抗体最初设计的结合模式。这形成了一个完美的“组合拳”:AI负责精准的“骨架设计”,定向进化负责高效的“性能优化”。

短板二:实验成功率依然偏低。 另一个现实问题是,尽管AI能生成大量设计,但最终通过实验验证能够成功结合的比例并不高(在0%到2%之间)。这意味着研究人员仍需通过高通量筛选,才能从大量“理论可行”的设计中找到“实际有效”的分子。

如何提高这个成功率?关键在于找到一个更强大的“过滤器”,在实验开始前,就从计算机层面更准确地预测哪些设计最有可能成功。

研究人员回顾他们的工作时,一个更新、更强大的AI工具,AlphaFold3,恰好发布了。AlphaFold3在预测蛋白质相互作用方面展现出了比其前代更强的能力。于是,他们进行了一项“事后诸葛亮”式的回溯性分析:用AlphaFold3去评估他们之前所有的VHH设计。

分析结果提供了一条清晰的前进道路。AlphaFold3对每个设计给出了一个界面预测模板建模评分(ipTM score),这个分数可以衡量其对复合物结构预测的置信度。研究人员发现,那些实验成功的VHH设计,其AlphaFold3的ipTM分数普遍显著高于失败的设计。他们绘制的受试者工作特征曲线(ROC curve)显示,曲线下面积(AUC)高达0.86,表明ipTM分数是一个非常有效的预测指标。

这意味着什么?如果在未来的研究中,研究人员在合成基因之前,先用AlphaFold3对RFdiffusion生成的设计进行一轮“虚拟筛选”,只挑选那些ipTM分数高的候选者,那么实验的成功率将有望得到数倍甚至数十倍的提升。

钥匙已被铸造,但门后的世界仍需探索

这项发表在《自然》上的研究,无疑是计算结构生物学和抗体工程领域的一座里程碑。它系统性地构建并验证了一个前所未有的工作流程,使得依据特定功能需求、从原子层面“理性设计”抗体成为可能。

这把由AI铸造的“钥匙”,为我们打开了一扇通往全新世界的大门。门后的景象,充满了无限的可能性:

速度与成本的革命:传统的抗体发现动辄耗时数年,而计算设计和验证的周期可以被缩短到几个月甚至几周。这将极大地加速新药研发的进程,降低失败风险和研发成本。

攻克“不可成药”靶点:对于那些传统免疫方法难以产生抗体的“免疫盲点”表位,或者病毒上那些为了逃逸免疫而高度保守、但免疫原性不强的关键位点,AI设计提供了一种全新的解决方案。我们可以直接绕过免疫系统的限制,针对这些“软肋”设计武器。

功能的精细定制:除了结合,抗体的功能还包括激活或抑制信号通路、诱导构象变化等。基于结构的精准设计,让我们有能力去创造具有特定调控功能的抗体,而不仅仅是简单的“阻断剂”。

优化成药性:在设计的初始阶段,就可以将溶解度、稳定性、免疫原性等“成药性”相关的参数考虑进去,从源头上避免后续开发中可能出现的种种问题。

当然,我们也要清醒地认识到,这把钥匙刚刚铸成,我们对门后世界的探索才刚刚开始。目前的成功率仍需提升,亲和力的从头设计能力也有待加强,如何让AI设计的CDR序列更接近于人类自身的序列以降低免疫原性,这些都是未来需要解决的重要课题。

但无论如何,一个全新的时代已经拉开序幕。过去,我们是自然的“学徒”,努力模仿和筛选免疫系统的杰作。而今天,借助AI的强大能力,我们正逐渐成为“设计师”,开始用自己的智慧和语言,创造出自然界中或许从未存在过的、为解决特定问题而生的生命分子。从一个原子开始,一个由理性设计主导的精准医疗新纪元,正向我们走来。

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->